RD-Embed: Unified representations of rare-disease knowledge from clinical records
本文提出了 RD-Embed,这是一种基于三阶段表示框架的轻量级模型,它通过融合临床文本、SNOMED 编码信号及图学习技术,显著提升了从异构电子健康记录中检索罕见病诊断和进行基因优先排序的准确性与鲁棒性。
189 篇论文
本文提出了 RD-Embed,这是一种基于三阶段表示框架的轻量级模型,它通过融合临床文本、SNOMED 编码信号及图学习技术,显著提升了从异构电子健康记录中检索罕见病诊断和进行基因优先排序的准确性与鲁棒性。
该研究利用大规模全基因组关联分析数据,通过 MiXeR 和 conjFDR 等方法揭示了抑郁症与慢性疼痛之间存在高度一致的遗传重叠,并鉴定出 375 个共享位点及 PPP6C 等关键基因,阐明了两者共病的分子机制。
该研究通过英国生物样本库和 Geisinger MyCode 两个大型人群队列的基因组筛查发现,携带 PALB2 致病性杂合变异的个体患多种癌症(特别是乳腺癌和胰腺癌)的风险及全因死亡率均显著升高,尽管其风险估计值低于基于家族史筛选的研究结果,且受家族癌症史的影响。
该研究报道了一种无需修改现有 IVF 流程的高精度非侵入性胚胎植入前遗传学检测(niPGT)新方法,通过改进的线性全基因组扩增和贝叶斯算法,成功利用废弃培养液实现了对单基因及多基因疾病的高准确率诊断,且结果与侵入性活检完全一致。
该研究证实双等位基因WDR91变异通过损害内体成熟和自噬失调,导致以进行性小头畸形、微裂脑、胼胝体发育不全及早发性癫痫为特征的严重神经发育障碍。
这项研究通过定性访谈和问卷调查,揭示了前列腺癌患者在考虑生殖系基因检测时存在的知识缺口、对家族风险及保险歧视的担忧,并据此开发了一套旨在辅助患者做出知情决策的精准医疗信息工具包。
该研究利用基于功能的 SBayesRC 贝叶斯精细定位框架,对超过一百万欧洲血统个体的冠状动脉疾病全基因组关联数据进行分析,揭示了该疾病的高度多基因架构,确定了 36 个高置信度因果变异及其对应的关键基因(如 PHACTR1、APOE 和 LPL),并阐明脂蛋白功能、血管稳态及细胞应激与炎症是驱动冠心病遗传风险的核心生物学通路。
本研究鉴定出 TBC1D7 基因 5' UTR 区的 CCG 重复序列扩增是欧非裔人群中眼咽远端肌病(OPDM)的新致病原因,揭示了该基因通过显性毒性功能获得机制致病,并强调了系统性筛查非编码区重复序列在不明原因神经肌肉疾病中的重要性。
该研究通过大规模多性状全基因组关联分析,揭示了胰岛素抵抗的遗传架构,阐明了脂肪组织功能障碍(特别是内脏脂肪增加和皮下脂肪减少)的核心作用,并鉴定出包括 LAMB1、PLAUR、INPP5A 及 KLK1 在内的多个关键调控基因与潜在治疗靶点。
该研究介绍了俄罗斯 FSHD 患者登记处的首批数据,揭示了该队列具有更年轻的年龄特征、以 3 个 D4Z4 重复单元为主的遗传分布,并通过聚类分析识别出三种不同的疾病进展轨迹,为改善患者分层提供了框架。
该研究通过整合单细胞多组学与全基因组关联分析,系统鉴定了胶质母细胞瘤发生中的高置信度可成药基因,并揭示了星形胶质细胞、少突胶质细胞前体细胞及兴奋性神经元等特定细胞类型在肿瘤微环境互作中的因果作用机制,为精准治疗提供了新靶点。
本文介绍了名为 SafeGene 的新型计算平台,该平台针对沙特阿拉伯及海湾合作委员会国家高近亲结婚率导致的遗传病负担,整合了区域特异性人群遗传学、孟德尔遗传模型及近交系数分析,能够预测 50 多种后代疾病风险,有望显著降低患病出生率并节省巨额医疗开支。
这项研究通过对 200 万人的数据进行分析,首次揭示了女性特异性肥胖遗传因素通过激素反应和致癌通路显著增加子宫内膜癌风险,并阐明了肥胖相关与独立遗传机制在疾病易感性中的不同作用。
本研究通过结合 AI 驱动的分子建模与体外细胞实验,证实了 TGFBR2 基因中的新型罕见变异 E431K 会破坏蛋白稳定性并导致 TGF-β信号通路异常,从而确诊该患者为洛伊斯 - 迪茨综合征 2 型。
该研究通过与 18 个罕见病患者组织合作,利用 gnomAD 数据库开发了公开工具 GeniE 来估算 22 种常染色体隐性遗传病的遗传患病率,强调了患者参与对动态更新数据及赋能罕见病倡导的重要性。
这项多中心前瞻性研究开发了一种名为区域基序多样性评分(rMDS)的新型 cfDNA 片段组学指标,通过量化 cfDNA 5'端末端基序的熵变,成功区分了头颈鳞状细胞癌免疫治疗患者的响应情况,其预测性能优于现有标志物,并揭示了末端基序动态变化与肿瘤免疫互作及端粒生物学的潜在联系。
这项针对数百万不同祖先参与者的多变量全基因组关联研究,通过整合广泛焦虑症、抑郁症和创伤后应激障碍的遗传数据,揭示了内化障碍谱系中由广泛细胞调控机制驱动的共享生物学基础,以及由神经发育、突触和应激反应通路特异性扰动构成的各疾病独特遗传风险。
本研究开发并验证了一种高灵敏度、高重现性的定量 LC-MS/MS 方法,用于检测脑脊液中的硫酸乙酰肝素衍生物 GlcNS-GlcUA,该方法经确证适用于黏多糖贮积症 IIIA 型(Sanfilippo 综合征)的疾病监测、疗效评估及监管审批。
该研究通过人类家系遗传分析及跨物种功能验证,证实 FRMPD4 基因突变不仅导致智力障碍和癫痫,也是非综合征性听力损失的致病原因,从而拓展了该基因的表型谱并确立了其在听觉功能中的进化保守作用。
这项研究通过对印度超过 500 例乳腺癌样本进行全基因组和转录组分析,首次构建了该人群的综合分子图谱,揭示了独特的驱动基因突变、代谢重编程机制及免疫特征,并鉴定出具有预后价值和临床治疗潜力的新亚型与生物标志物。